查看原文
其他

基因与基因之间的关系千丝万缕,基因共表达网络(Gene co-expression network)是用来分析基因间作用关系的一种常用手段。诚然,通过像STRING、PINA等数据库工具可以很容易的获取编码基因间的作用关系,但是只能获取已知的作用关系,并且结论可能会由于具体实验条件的不同而产生一定的偏差。此外,在预测非编码基因的靶基因时,除了各种靶基因预测工具,基因共表达网络分析也是一件利器。


其实基因共表达网络分析并非十分复杂的分析,用EXCEL就能搞定其中的数据处理。


先来说说基因共表达网络分析的流程

1、获取基因表达数据,进行数据标准化;

2、筛选差异基因,构建差异基因的表达矩阵;

3、计算差异基因间的表达相关性系数;

4、利用Cytoscape构建网络,分析网络拓扑结构。


前两步的具体方法在前面的文章中讲过(暴躁的EXCEL测序数据分析方法(前传),暴躁的EXCEL测序结果分析方法),这里就不赘述了,差异基因的表达矩阵利用vlookup函数即可构建。


今天实操过程中用的是GEO中Series Matrix File(s)格式的数据。

差异基因也没有筛选,只是随便选了50个基因进行分析演示

利用EXCEL(版本为2013)自带的工具分析相关系数。在左上角的“文件”里“Excel选项”“加载项”中,在“非活动应用程序加载项”中,找到“分析工具库”,然后在下方“转到”Excel加载项后,按“确定”,即可在“数据”选项中的分析下添加“数据分析”。

选择逐行分析,并将结果输出到新的表格中


然后把表头加上(转置粘贴的运用,见之前的微信文章)

现在获取的是一个表达相关系数的矩阵,我们最后要生成网络图,这样的矩阵图是用不了的,必须得拆分成普通表格(如下图)。拆分矩阵我们需要用到这样的公式:

BA单元格:=OFFSET(1,INT((ROW(A1)-1)/50)+1,0)

BB单元格:=OFFSET(1,COLUMN(A1)-1,MOD(ROW(A1)-1,50))

BC单元格:=OFFSET(2,INT((ROW(A1)-1)/50),MOD(ROW(A1)-1,50))

输入完成后,下拉填充即可。

公式中50这个数字是你的基因数量,本次演示用的是50个基因。

表达相关性的数据有了,建立筛选标准进行筛选(常用>0.98或<-0.98的标准,正值为正相关,负值为负相关)。然后将数据导入到Cytoscape中你就可以做出下图了。(如何用Cytoscape提升文章档次?

讲完了~~听首歌消个愁吧~~

没看过瘾?那再给你们讲个EXCEL的高级用法——定位

有没有傲娇的小童鞋说,我非要保留相关性系数的矩阵,我要把数据做成下图这样(把大于0.9或小于-0.9的数据留下,其它全都清除)。

首先用IF函数做一个筛选

在B55单元格输入公式:=IF(OR(B2>0.9,B2<-0.9),B2)

然后利用自动填充工具把整个区域都填充上数据。我们可以看到满足筛选条件的显示的是具体数值,不满足的显示是FALSE

我们调出定位工具(快捷键为F5

引用位置设置为数据区域

然后设置定位条件,选择公式中的逻辑值

所有的FALSE就全部选中了,然后清除内容就大功告成了。

定位功能主要是利用条件格式来筛选出不规则的选择区域。常用的筛选标准还有空值与其它公式与其它文本与其它数字与其它可见单元格与隐藏单元格等。

定位的应用很多,比如快速填充空值

下图中的左列如何做成右列?

选中目标区域设置定位条件空值

在A2单元格中输入:=A1

然后按Ctrl+回车即可完成填充。

今天演示的材料都上传到网盘中了,大家可以自己下载下来练练手

链接:http://pan.baidu.com/s/1hs8BNNI

密码:pg5i


相关文章:

(工具篇):S4E07: 用Excel就能实现的几个逆天功能!

暴躁的EXCEL测序结果分析方法

暴躁的EXCEL测序数据分析方法(前传)

(工具篇)S4E18:Cytoscape作图介绍part1

(工具篇)S4E24:Cytoscape作图介绍part2

如何用Cytoscape提升文章档次?

怪阿姨脑洞作图时间

长按二维码识别关注“小张聊科研”

关注后获取《科研修炼手册》1、2、3、4、5,基金篇、生信特辑

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存